在這篇文章中,我想探討我對數據類型的理解(以Python為重點)。我發現這通常是人們容易忽視的事情,可能是因為看似簡單易懂,但慢慢地後來在SQL或Python做數據轉換時,一定會由於類型不匹配而遇到麻煩。
數據類型:Integers/double(整數/浮點數)、floats (浮點數)、strings(字符串)、dates/datetime (日期/時間)、Boolean(布爾值)
Python中有3種數值類型:整數、雙精度/浮點數、複數
整數
整數是沒有小數的整數。它可以是負數或正數的整數,長度無限。
雙精度/浮點數
浮點數/雙精度是帶有1個或2個小數的數字(可以是正數/負數)
複數
複數數據類型是用於表示復數的數據類型。復數以"a + bi"的形式表示,其中a是實數,“b”是虛數,而“i”是-1的平方根。
例如: complex(real, imaginary)
-- 實數: complex()中的第一個參數,它定義了複數的實部。如果未定義,則默認為0
-- 虛數: 你可以使用imag()在Python中訪問複數的虛數部分
您可以使用2種方式聲明複數:
例如:complex_num = 2 + 5j
complex(2, 5)
通常情況下,除非進行復雜的數學計算,否則不太會使用複數。
字符串
通常用於定義文本/單詞。你可以用""括住單詞來聲明字符串。
*例如: str = "Hello"
*例如: print("Hello World")
*例如: sentence = """今天是美好的一天"""
字符串也可以分為f-字符串和r-字符串
f-字符串(f"" / f'')
允許你在字符串中使用{}引用其他變數
例如:name = "Sandy" age = 28 sentence = f"Hello my name is {name} and I am {age} years old." *輸出:* Hello my name is Sandy and I am 28 years old.
r-字符串(r""/ r'')
允許你將反斜杠(\)引用為文字字符。在分配路徑變數時,R字符串非常有用。
例如:path = r"/home" print(os.path.join(path, r"User/Desktop", "file.txt")
日期
可以用來顯示日期(mm-dd-yyyy)
你通常可以使用字符串分配日期變量,然後將其轉換為日期時間
*例如: *date_variable = '2023-08-31' my_date = datetime.strptime(date_variable, '%Y-%m-%d')
相反(i.e. 將日期轉換為字符串)可以使用 mydate.strftime('%Y-%m-%d')
最常用的模塊是datetime和pandas.to_datetime。
日期時間
可以用來顯示日期+時間(mm-dd-yyyy hh:MM:ss:ms。
最常用的模塊是datetime.timstamp()。
布爾值
分配TRUE或FALSE或導致True/False的任何表達式。
例如:
x = True
y = False
z = (1+1 == 2)
通常使用布爾bool()來評估變量的內容。除非它是“”,否則它通常會返回TRUE。
REF:
https://www.geeksforgeeks.org/
https://pandas.pydata.org/docs/reference/api/pandas.to_datetime.html